これまでの授業では、個々の確率変数を孤立して観察する一次元世界にいました。今、私たちの視野を広げて 同時確率分布。同時に複数の変数を観察するイメージを思い浮かべてください——たとえば学生の身長と体重、またはダーツがボードに当たる座標などです。この枠組みにより、変数どうしがどのように相互作用し、互いに依存しているか、あるいは完全に独立しているかを数学的に記述できます。
1. 同時累積分布関数(JCDF)
多変量解析の基礎は、同時分布関数 $F(a_1, a_2, \dots, a_n)$ です。これは複数の条件が同時に満たされる確率を定義します。
$F(a_1, a_2, \dots, a_n) = P\{X_1 \le a_1, X_2 \le a_2, \dots, X_n \le a_n\}$
この式は、各変数 $X_i$ がそれぞれの閾値 $a_i$ を下回る確率を同時に表しています。幾何学的には、2次元空間において、ランダムなペア $(X, Y)$ が点 $(a, b)$ の左下にある半無限長方形内に存在する確率を意味します。
2. 確率密度の無限小的解釈
連続型変数の場合、確率は 同時確率密度関数(JPDF)、$f(x, y)$ で記述します。離散的な場合とは異なり、一点での確率はゼロです。代わりに、無限小の領域に注目します:
- ペア $(X, Y)$ が非常に小さな長方形内に入る確率は次の式で与えられます:
$P\{a < X < a + da, b < Y < b + db\} = \int_{b}^{b+db} \int_{a}^{a+da} f(x, y) \, dx \, dy \approx f(a, b) \, da \, db$ - あるいは、次のように表現できます:$P\{x < X < x + dx, y < Y < y + dy\} \approx f(x, y) dx dy$
これにより、$f(x, y)$ が 面積 直交座標平面上の領域に対する「密度」ということが明らかになります。
3. 依存性と幾何的制約
確率論において、 独立でない確率変数は依存していると言われます。これは単なる代数的性質ではなく、しばしば分布の サポート に現れます。
例1c:円上のランダムな点
原点 $(0,0)$ を中心とする半径 $R$ の円内から一様に選ばれた点 $(X, Y)$ を考えます。変数 $X$ と $Y$ は 依存している という理由で、$X = x$ がわかれば $Y$ の取りうる値が制限されるためです。
もし $X$ が $R$ に近ければ、$Y$ は $0$ に近くなる必要があります。数学的に、$Y$ は制約されます:$-\sqrt{R^2 - X^2} \le Y \le \sqrt{R^2 - X^2}$。この境界が、同時密度関数が独立な周辺確率密度に分解できない原因となります。
🎯 核心的洞察
同時分布は共有された確率空間を定義します。一方の変数の実現値が他方の変数の可能な結果を制限するとき(例1c、1d、1eの通り)、依存性の本質を捉えているのです。